arxiv：2403.15916v1 [CS.AI] 2024年3月23日__

arxiv：2403.15916v1 [CS.AI] 2024年3月23日

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

arxiv：2403.15916v1 [CS.AI] 2024年3月23日

¥ 1.0

热度

多代理增强学习的主要挑战之一是随着代理数量的增加而进行的可伸缩性。如果考虑到时间上考虑的问题，则此问题进一步加剧。当今最新的解决方案主要遵循集中式培训，并通过分散的执行范式进行集中式培训，以应对可伸缩性问题。在本文中，我们提出了依赖时间的多代理变压器，这些变压器可以通过使用熟练处理大输入的变压器来有效地解决时间依赖的多代理问题。我们强调了该方法对两个问题的功效，并使用统计工具来验证策略下生成的轨迹满足任务的概率。实验表明，在两种情况下，我们的方法对文献基线算法具有较高的性能。关键字：多代理增强学习，临时依赖性，变压器，信号温度逻辑

添加pdf代下载 VIP点击下载文件